Utilisation de croyances heuristiques pour la planification multi-agent dans le cadre des Dec-POMDP. (Using heuristic belief points for Dec-POMDP planning)

نویسنده

  • Gabriel Corona
چکیده

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Programmation dynamique à base de points pour la résolution des DEC-POMDPs

RÉSUMÉ. Nous présentons un nouvel algorithme de planification pour la construction de systèmes multi-agents réactifs et situés pouvant se modéliser par des processus de décision de Markov décentralisés (DEC-POMDP). Cet algorithme est fondé sur la programmation dynamique à base de points. Il est dérivé de techniques de programmation dynamique optimale utilisées pour résoudre des jeux stochastiqu...

متن کامل

Les POMDP font de meilleurs hackers: Tenir compte de l'incertitude dans les tests de penetration

Résumé : Les tests de pénétration sont une méthodologie pour évaluer la sécurité d’un réseau en générant et exécutant de possibles attaques informatiques. Automatiser cette tâche permet de réaliser des tests réguliers et systématiques. Une question clef est : “Comment générer ces attaques ?” Ce problème se formule naturellement comme de la planification dans l’incertain, plus précisément avec u...

متن کامل

Heuristique pour l’apprentissage automatique décentralisé d’interactions dans des systèmes multi-agents réactifs. Heuristics for automatic decentralized interaction learning in reactive multi-agent systems

This article proposes an heuristics for the automatic computation of interactions in reactive multi-agent system. It describes first the Interac-DEC-POMDP formalism and then focuses on a algorithm based on reinforcement learning techniques and distribution of individual rewards among agents to build interaction and collective behaviour in a sub-class of DEC-POMDP. These techniques produce adapt...

متن کامل

Prise de décision en temps-réel pour des POMDP de grande taille

RÉSUMÉ. Cet article présente une méthode d’approximation pour les processus décisionnels de Markov partiellement observables (POMDP) qui est basée sur une recherche en profondeur pour la planification dans un environnement temps-réel dynamique. L’idée de base de notre approche, appelée RTBSS (Real-Time Belief Space Search), est d’éviter de calculer des politiques complètes pour des POMDPs. Cett...

متن کامل

Révision des croyances dans un environnement multiagent : Une apprche basée sur la crédibilité et les arguments

Résumé Peu de recherches se sont penchées sur la problématique de la révision des croyances dans un cadre multiagent. En tout cas, à notre connaissance, aucune ne s'est penchée sur la révision des croyances tenant compte de la crédibilité des informateurs, tout en gardant trace des arguments en faveur de la révision, une fois celle-ci e ectuée. C'est ce problème qui nous a motivé et pour lequel...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011